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【摘要 】 背景 近年 来 ,转录 组 测序 技术 在 肝癌 领域 的 大 量 应 用 为 肝癌 的 基因 组 和 生物 学 研究 提供 了 帮助 ， 对 
近 二 十 年 RNA-seq 应 用 于 肝癌 研究 的 文献 进行 总 结 分 析 ， 有 助 于 让 研究 者 全 面 了 解 该 领域 的 研究 热点 与 最 新 进展 ， 为 
后 续 研究 提供 参考 。 目 的 ”通过 文献 计量 学 分 析 对 RNA-seq 在 肝癌 治疗 、 诊 断 、 发 生机 制 等 各 方面 研究 的 应 用 情况 
进行 整体 评价 ， 以 揭示 全 球 RNA-sed 应 用 于 肝癌 领域 研究 热点 的 分 布 情况 ， 进 而 推测 未 来 该 领域 的 发 展 趋势 。 方 法 
检索 2001-01-01 至 2022-12-31 期 间 Web of Science 数据 库 收 录 的 RNA-sed 应 用 于 肝癌 研究 领域 的 英文 文献 ， 运 用 
Microsoft Excel 2016 软件 对 文献 进行 发 文 量 分 析 ， 运 用 CiteSpace 软件 进行 作者 、 国 家 、 机 构 、 关 键 词 的 可 视 化 分 析 ， 
使 用 发 文 量 、 中 心性 、 聚 类 模块 值 和 平均 轮廓 值 等 指标 对 可 视 化 结果 进行 评价 。 结 果 ”在 数据 库 中 共 检 索 到 RNA-seq 
应 用 于 肝癌 研究 领域 的 文献 1397 篇 ， 分 析 结 果 显 示 ， 该 领域 的 核心 作者 群 已 经 形成 ; 中 国 发 文 量 最 多 ， 但 研究 深度 
略 有 欠缺 ， 美 国 发 文 量 仅 次 于 中 国 ， 但 中 心性 最 高 ， 为 0.44; 高 发 文 量 的 机 构 大 多 分 布 在 中 国 ， 影 响 力 较 大 的 机 构 大 
多 分 布 在 美国 ; 关键 词 分 析 显 示 领 域 的 研究 热点 为 肝癌 发 生发 展 相关 的 分 子 机 制 、 基 因 表达 及 其 分 子 标志 物 。 结 论 
肝癌 发 生发 展 的 分 子 机 制 、 疾 病 的 的 生物 标志 物 和 治疗 靶 点 是 该 领域 目前 的 研究 热点 ， 临 床 精准 医疗 可 能 成 为 未 来 的 
重点 研究 方向 。 
【关键 词 】 肝癌 ; RNA-seq; 研究 热点 ; 研究 趋势 ;CiteSpace; 文献 计量 分 析 ; 可 视 化 
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[Abstract] Background In recent years, the extensive application of transcriptome sequencing technology in 
the field of liver cancer has provided assistance in genomic and biological studies of liver cancer. Summarizing and analyzing 
the literature on RNA-seq applied to liver cancer research in the last two decades can help to provide researchers with a 
comprehensive understanding of the research hotspots and latest progress in this field, and provide reference for subsequent 
research. Objective To evaluate the application of RNA-seq in various aspects of liver cancer research, such as treatment, 
diagnosis, and pathogenesis as a whole by bibliometric analysis, so as to reveal the global distribution of research hotspots in 
the field of RNA-seq applied to liver cancer, and predict the development trend of this field in the future. Methods Web of 
Science database was searched for English literature related to the application of RNA-seq to liver cancer research from 2001-01- 
01 to 2022-12-31, and the number of publications was analyzed using Microsoft Excel 2016 software. CiteSpace 6.1.R6 software 
was used for visualization of authors, countries, institutions, and keywords using CiteSpace software. Results A total of 1397 


documents on the application of RNA-seq to liver cancer research were retrieved in the database, and the analysis results showed 
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that the core group of authors in this field had been formed; China has the largest number of publications, but the research depth 


is slightly lacking, the United States has the second largest number of publications after China, but with the highest centrality 0.44 } 


most of the institutions with a high publication volume are located in China, and most of the institutions with greater influence 


are located in the United States; the keyword analysis showed that the research hotspots in the field include the molecular 


mechanism, gene expression and molecular markers related to the occurrence and development of liver cancer. Conclusion 


The molecular mechanism of liver cancer development, biomarkers and therapeutic targets of the disease are the current research 


hotspots in this field, and clinical precision medicine may be a key research direction in the future. 
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原 发 性 肝 瘤 是 全 球 常 见 的 恶性 肿瘤 之 一 。 据 统计 ， 
2020 年 原 发 性 肝癌 的 全 球 新 发 病例 共 905677 例 ， 占 所 
有 新 发 癌症 病例 的 4.7%, 位 居 新 发 癌症 病例 的 第 六 位 ; 
死亡 患者 共 830180 例 ， 占 所 有 癌症 死亡 病例 的 8.3%， 
位 居 癌 症 死亡 病例 第 三 位 ''" 。 近 几 十 年 来 ， 研 究 者 在 
肝癌 的 诊断 、 治 疗 及 预后 等 方面 取得 重大 进展 ， 尤 其 是 
随 着 RNA-seq 等 基因 测序 技术 被 应 用 于 生物 医学 领域 ， 
肝癌 的 发 病 机 制 以 及 诊断 、 预 后 相关 的 生物 标志 物 被 不 
断 发 现 ， 在 一 定 程 度 上 改善 了 肝癌 患者 的 结局 。 

转录 组 测序 技术 (RNA sequencing，RNA-seq) 是 
一 种 比较 成 熟 的 转录 组 学 研究 方法 ， 主 要 利用 高 通 量 测 
序 方法 获得 细胞 组 织 的 转录 组 信息 ， 可 以 用 于 研究 不 同 
的 RNA 群体 ， 例 如 信使 RNA、 非 编码 RNA 等 ， 有 助 
于 发 现 新 的 转录 本 、 识 别 可 变 剪 接 基 因 和 检测 等 位 基因 
特异 性 表达 "1 。 近 年 来 ， 转 录 组 学 已 被 应 用 于 识别 疾 
病 的 生物 标志 物 以 及 研究 各 种 刺激 和 应 激 导 致 的 生物 学 
反应 等 领域 ， 并 在 基因 组 和 分 子 生物 学 研究 中 发 挥 着 关 
SER UU, 

随 着 转录 组 测序 技术 的 广泛 运用 ， 出 现 大 量 肝癌 
RNA-seq 研究 的 相关 高 质量 文献 ， 文 献 中 所 包含 的 信 
息 ， 可 以 较为 全 面 地 反映 这 一 领域 研究 的 发 展 进程 和 热 
点 动向 。 通 过 对 既往 研究 成 果 的 总 结 ， 可 以 对 未 来 研究 
以 及 学 科 建 设 等 方面 起 到 积极 的 推动 作用 。 本 研究 运用 
CiteSpace6.1.R6 软件 ， 对 WOS 数据 库 近 二 十 年 来 肝 
A RNA-seq 研究 相关 的 文献 进行 全 面 的 文献 计量 学 分 
Jr. 旨 在 了 解 该 领域 当前 的 研究 热点 和 未 来 的 发 展 趋势 ， 
为 后 续 进一步 研究 提供 参考 。 

1 资料 与 方法 
1.1 资料 来 源 及 检索 策略 

本 文 的 统计 分 析 数 据 来 源 于 Web of Science 核心 
合集 ， 引 文 索引 选择 “Science Citation Index Expanded 
(SCI-EXPANDED ) ”， 为 保证 检索 文献 的 全 面 性 ， 
使 用 普通 检索 。 以 检索 式 (TS= “livercancer” OR 
"hepatocellularcarcinoma" 
OR “hepatoma” OR  "hepatocarcinoma" OR “HCC” 


OR ^hepaticcarcinoma" 


Cancer of the Liver; RNA-seq; Research hotspots; Research trends; CiteSpace; Bibliometric 


OR "hepaticcancer" OR 
(TS= "RNAsequencing" OR "RNA-seq" OR 
"RNAsequence" ) 进行 检索 ,语言 类 型 为 "English" , 
文献 类 型 限定 为 “Article”， 时 间 跨 度 为 2001 年 1 月 1 
日 至 2022 年 12 H 31 日 。 同 时 ， 为 保证 来 源 数据 的 质 
量 和 代表 性 ， 由 两 名 课题 组 成 员 分 别 根据 文献 内 容 对 其 
进行 筛选 ， 排 除 与 主题 “肝癌 ”和 “RNA-sedq” 不 相关 
的 文献 ,核查 对 比 并 去 重 后 最 终 保 留 文献 1397 篇 ,以 “ 纯 
文本 文件 ”格式 导出 ， 记 录 内 容 选 择 “ 全 记录 与 引用 的 
参考 文献 ”， 最 终 导 出 的 数据 包括 每 篇 文献 的 标题 、 关 

键 词 、 作 者 、 机 构 、 地 址 、 摘 要 、 发 文 时 间 等 内 容 。 
1.2 ”研究 方法 

1.2.1 ”可视化 分 析 法 ”运用 CiteSpace 6.1.R6 软件 ， 以 
获取 的 RNA-sed 应 用 于 肝癌 人 研究 的 相关 文献 作为 数据 
资料 ， 将 文献 信息 进行 转换 ， 统 计 每 年 的 文献 数量 ， 使 
用 Excel 软件 绘制 年 发 文 量 和 年 累计 发 文 量 趋势 图 ， 分 
析 2001 年 1 月 1 日 至 2022 年 12 月 31 日 的 发 文 量 趋势 ， 
并 对 该 研究 领域 的 作者 、 国 家 和 机 构 的 合作 情况 进行 网 
络 可 视 化 分 析 ， 对 该 研究 领域 的 文献 关键 词 进行 共 现 分 
析 、 聚 类 分 析 和 时 间 线 图 分 析 。 

122 参数 设置 ”将 时 间 跨 度 设置 为 2001 年 1 月 至 
2022 年 12 月 ， 时 间 切 片 设置 为 2 年 ， 节 点 冰 值 参数 
g-index 根据 节点 情况 设置 在 5-25 之 间 ，TopN 96 均 选 
择 10。 

1.2.3 数据 分 析 及 判断 标准 ”使 用 发 文 量 、 中 介 中 心 
性 、 聚 类 模块 值 和 平均 轮廓 值 等 指标 对 可 视 化 结果 进行 
评价 。 中 介 中 心性 是 测度 节点 在 网 络 中 重要 性 的 指标 ， 
值 越 高 ， 说 明 节 点 越 重要 ， 若 中 心性 超过 0.1 则 说 
明 该 节点 为 中 心 节 点 ， 在 研究 中 较为 重要 上 且 具 有 较 大 
的 影响 力 。 聚 类 模块 值 Q (Modularity ) 和 平均 轮廓 值 S 
( Silhouette ) 则 是 聚 类 图 谱 绘制 效果 的 评判 依据 ，Q 值 
用 于 衡量 聚 类 效果 , 该 值 越 大 , 表示 聚 类 划分 效果 越 好 ; 
S 值 用 于 衡量 整个 聚 类 成 员 的 同 质 性 ， 该 数值 越 大 ， 则 
代表 各 聚 类 成 员 的 相似 性 越 高 。 一 般 认为 Q>0.3，S>0.7 
时 聚 类 分 布 良 好 。 


“livercarcinoma” ) AND 
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2 结果 


2.1 RNA-seq 应 用 于 肝癌 研究 的 发 文 量 趋势 分 析 

发 文 量 是 最 基本 的 文献 计量 指标 ， 包 括 年 发 文 量 与 
Bu ~ 2001-2022 年 共 检索 到 RNA-seq 应 用 
于 肝癌 研究 领域 的 文献 共 1397 篇 ， 对 年 发 文 量 进行 统 
计 发 现 ，2001-2016 年 ， 发 文 量 从 4 篇 增 至 48 篇 ,为 
平稳 增长 期 ，2017-2022 年 ， 发 文 量 从 80 篇 激增 至 366 
篇 ， 为 快速 增长 期 。 对 年 累计 发 文 量 进行 指数 拟 合 ， 
现 拟 合 优 度 尺 =0.977， 说 明 2001 年 至 2022 年 该 领域 的 
累计 发 文 量 呈 指 数 增长 (网 1) 。 


1 800 一 一 年 累计 发 文 量 
(指数 ) 年 累计 发 文 量 F 


1600 --- 


0 ioi i i i ı 1 
S e, co e c clo d db c9 AQ AN Dy A0 A 46 Ao LAO 
CRINES STARS SOR DAN SASSARI NY 

人 

UE: A 为 累计 发 文 量 ; B 为 年 发 文 量 。 

图 1 2001-2022 年 RNA-seq 应 用 于 肝癌 研究 的 年 发 文 趋势 


Figure 1 Analysis of annual publications related to the application of 


RNA-seq in liver cancer research from 2001 to 2022 


2.2 RNA-seq 应 用 于 肝癌 研究 的 发 文 作者 分 析 

作者 合作 网 络 图 谱 能 够 体现 RNA-seq 应 用 于 肝癌 
这 一 研究 领域 研究 者 之 间 的 合作 关系 。 在 CiteSpace 选 
取 发 文 量 排名 前 1096 的 作者 ， 绘 制作 者 合作 共 现 网 络 
图 谱 ( 图 2) 。 网 络 的 节点 数 为 377， 连 线 数 为 774， 
密度 为 0.0 109。 节 点 表示 作者 ， 节 点 越 大 ， 表 示 作 者 
发 文 次 数 越 多 ; 连 线 表示 作者 间 的 合作 关系 , 连 线 越 粗 ， 
表示 作者 间 合 作 越 紧密 。 总 体 来 看 ， 人 研究 者 之 间 较 为 分 
散 ， 并 没有 形成 明显 的 合作 网 络 。 

此 外 ， 根 据 作者 发 文 量 还 能 确定 这 一 领域 的 核心 研 
究 群 体 。 普 莱 斯 定律 中 核心 作者 的 计算 公式 为 : 

M ~ 0749 JN 

HF, M 指 论文 数量 ，N 指 对 应 年 限 中 论文 发 表 
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数量 最 多 作者 的 论文 数量 。 当 某 作者 发 表 论 文 数量 大 于 
M 时， 该 作者 为 该 领域 的 核心 作者 ; 而 当 核心 作者 发 表 
论文 总 量 达 到 该 领域 全 部 论文 的 50%， 说明 核 心 作者 群 
已 经 形成 。 

在 本 研究 所 选取 的 文献 中 ， 发 文 量 最 多 的 作者 是 
CHEN Gang (20 篇 ) ， 即 N=20， 根 据 公 式 计算 得 出 
M=3.35， 因 此 ， 发 文 量 >3.35 ( 取 整 为 3) 的 作者 为 该 
领域 的 核心 作者 。 经 分 析 可 知 ， 核 心 作者 共有 180 人 ， 
发 表 论 文 总 量 为 834 篇 ， 达 该 领域 发 文 量 的 69.6%， 因 
此 可 知 ， 该 领域 的 核心 作者 群 已 经 形成 。 

领域 内 发 文 量 排名 第 一 的 核心 作者 CHEN Gang (20 
篇 ) 所 在 团队 "| 主要 是 利用 肝癌 患者 的 测序 数据 ， 探 
讨 肝癌 的 发 病 机 制 ， 包 括 在 microRNA, IncRNA 以 及 某 
些 蛋 白质 等 分 子 层面 上 的 调控 机 制 ， 并 研究 了 这 些 标志 
物 在 肝癌 诊断 和 预后 等 方面 的 临床 意义 。 而 发 文 量 排名 
第 二 的 学 者 ZHOU Jian 和 FAN Jia (17 篇 ) 所 在 团队 
则 主要 是 通过 单 细 胞 测序 数据 ， 研 究 肝 细胞 癌 转 移 、 复 
发 、 生 长 侵袭 等 方面 的 信号 通路 ， 为 肝癌 的 临床 治疗 提 
供 思 路 。 
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图 2 2001-2022 年 RNA-seq 应 用 于 肝癌 研究 的 作者 合作 网 络 图 谱 
Figure 2 Author collaborative network map of RNA-seq applied to liver 
cancer research from 2001 to 2022 


2.5 RNA-seq 应 用 于 肝癌 研究 的 发 文 国家 分 析 

使 用 CiteSpace 绘制 国家 ( 地 区 ) 合作 网 络 图 谱 (图 
3 ) ， 网 络 的 节点 数 为 55， 连 线 数 为 242， 密 度 为 0.163。 
节点 表示 国家 (地 区 ) ， 连 线 表示 国家 ( 地 区 ) 间 的 合 
作 关 系 。 可 以 看 出 节点 的 共 现 密度 较 大 ， 国 家 间 形 成 了 
复杂 的 关系 网 络 ， 表 明 国家 间 存 在 相互 合作 研究 关系 。 
本 文 从 发 文 量 和 中 介 中 心性 两 个 方面 对 结果 进行 分 析 。 
首先 从 发 文 数量 上 来 看 , 中 国 发 文 量 最 多 , 高 达 990 篇 ， 
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位 居 第 二 的 是 美国 ， 为 261 篇 ， 接 下 来 依次 是 日 本 、 韩 
国 和 德国 ， 发 文 量 均 在 50 以 上 。 其 次 从 中 介 中 心性 上 
来 看 ， 在 图 3 中 紫色 外 圈 的 节点 均 为 中 心性 大 于 0.1, 
包括 美国 (0.44) ,德国 (0.3) ,英格兰 (023) ， 巴 
西 (0.14) 和 意大利 (0.13) 。 
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3 2001—2022 年 RNA-seq 应 用 于 肝癌 研究 的 国家 (地 区 ) 合作 
网 络 图 谱 


Figure 3 National (regional) cooperative network map of RNA-seq 


applied to liver cancer research from 2001 to 2022 


表 1 2001—2022 年 RNA-seq 应 用 于 肝癌 研究 发 文 量 前 10 位 的 国家 
Table 1 The top 10 prolific countries of RNA-seq applied to liver cancer 
research from 2001 to 2022 


a TIE 
we seus nr O pole M 
1 中 国 990 54.94 0.10 2001 
2 美国 261 14.48 0.44 2001 
3 日 本 67 3.72 0.06 2002 
4 韩国 62 3.44 0.02 2004 
5 德国 55 3.05 0.30 2001 
6 法 国 41 2.28 0.04 2016 
7 新 加 坡 28 1.55 0.10 2012 
8 英国 26 1.44 0.23 2003 
9 西班牙 26 1.44 0.09 2015 
10 ”意大利 25 1.39 0.13 2013 


2.4 RNA-seq 应 用 于 肝癌 研究 的 发 文 机 构 分 析 

通过 对 不 同 机 构 的 发 表 文 献 情况 进行 分 析 ， 可 以 了 
fE RNA 测序 技术 应 用 于 肝癌 领域 中 研究 力量 的 分 布 情 
况 。 使 用 CiteSpace 绘制 机 构 合 作 网 络 图 谱 CH A), 
网 络 中 节点 数 为 315， 连 线 数 为 1263， 密 度 为 0.0255。 
可 知 发 文 量 排名 前 5 位 的 分 别 是 复旦 大 学 ( 80 篇 ) 、 
中 山大 学 (78 篇) 、 海 军 军医 大 学 (64 篇) 和 广西 医 
科大 学 (64 篇 ) ， 均 为 中 国 的 机 构 。 中 心性 大 于 0.1 的 
机 构 包 括 美 国 哈佛 大 学 (0.15 ) ， 中 国人 民 解 放 军 海军 
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军医 大 学 (0.44) ， 美 国 西奈 山 伊 坎 医 学 院 (0.14 ) 。 

机 构 的 地 理 位 置 分 布 与 国家 的 发 文 情 况 相 对 应 ， 发 文 量 
多 的 机 构 均 分 布 在 中 国 ， 影 响 力 较 大 的 机 构 大 多 分 布 在 
美国 。 
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图 4 2001—2022 年 RNA-seq 应 用 于 肝 瘤 研究 的 机 构 合作 网 络 图 谱 
Figure 4 Institution cooperative network map of RNA-seq applied to liver 
cancer research from 2001 to 2022 


表 2 2001—2022 年 RNA-seq 应 用 于 肝癌 研究 发 文 量 前 10 位 的 机 构 
Table2 The top 10 prolific institutions of RNA-seq applied to liver cancer 
research from 2001 to 2022 


序号 — 研究 机 构 ZOE pppoe  PUCGOOM 
1 复旦 大 学 80 0.02 2009 
p 中 山大 学 78 0.08 2006 
3 ”海军 军医 大 学 64 0.14 2001 
4 上 海 交 通 大 学 64 0.05 2001 
5 广西 医科 大 学 64 0.01 2006 
6 浙江 大 学 57 0.04 2011 
7 中 国 科学 院 55 0.05 2009 
8 郑州 大 学 48 0.02 2016 
9 ”南京 医科 大 学 43 0.04 2010 
10 香港 大 学 41 0.06 2006 


2.5 RNA-seq 应 用 于 肝癌 研究 的 关键 词 共 现 分 析 
关键 词 是 文章 主题 的 高 度 概括 ， 代 表 着 文章 的 核心 内 
容 ， 其 频次 、 关 联 度 、 突 现 性 等 可 以 揭示 该 领域 的 研究 
热点 、 内 在 联系 及 重要 程度 。 使 用 CiteSpace 绘制 关键 
词 共 现 网 络 图 谱 ( 图 5) ， 网 络 中 节点 数 为 444， 连 线 
数 为 828， 密 度 为 0.0081。 可 知 图 中 关键 词 有 454 个 ， 
将 关键 词 按 照 频次 排序 ， 前 20 位 关键 词 见 表 3。 其 中 ， 
频次 100 以 上 的 关键 词 为 hepatocellular carcinoma ( 肝 细 
HEJA ) ~ expression ( 表达 ) 、cancer( FAJE ) , cells C 细胞 )、 
proliferation ( 扩散 ) ~ liver cancer ( 肝癌 ) | metastasis ( 转 
f? ) . identification ( 识别 ) , gene expression (HAKR 
达 ) 、growth( 增 长 ) gene ( 基因 ) | activation ( 激活 ) 、 
progression ( 进展 ) ， 由 此 可 以 看 出 ， 该 领域 的 研究 热 
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点 主要 包括 肝 瘤 发 生 、 扩 散 、 复 发 、 转 移 等 结局 相关 的 
分 子 机 制 、 基 因 表达 及 其 分 子 标志 物 等 。 
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5 2001—2022 年 RNA-seq 应 用 于 肝癌 研究 关键 词 网 络 分 析 图 谱 
Figure $ Keyword network analysis map of RNA-seq applied to liver 

cancer research from 2001 to 2022 


R3 2001-2022 年 RNA-seq 应 用 于 肝癌 研究 关键 词 频次 前 20 位 
Table 3 The top 20 keywords frequencies of RNA-seq applied to liver 
cancer research from 2001 to 2022 


序号 E 频次 “中 介 中 心性 AIARA 
1 hepatocellular carcinoma 750 0.13 2001 
2 expression 431 0.21 2002 
E cancer 404 0.07 2006 
4 cells 156 0.08 2009 
3 proliferation 138 0.03 2013 
6 liver cancer 129 0.02 2011 
7 metastasis 127 0.00 2015 
8 identification 121 0.15 2003 
9 gene expression 117 0.07 2001 
10 growth 117 0.05 2011 
11 gene 114 0.05 2012 
12 activation 110 0.06 2010 
13 progression 109 0.01 2015 
14 survival 92 0.10 2013 
15 apoptosis 89 0.15 2003 
16 invasion 81 0.06 2015 
17 pathway 75 0.00 2015 
18 liver 74 0.06 2006 
19 protein 69 0.11 2009 
20 landscape 67 0.09 2015 


2.6 RNA-seq 应 用 于 肝癌 研究 的 关键 词 聚 类 分 析 
关键 词 聚 类 图 谱 可 以 表明 该 领域 的 不 同 研 究 关 
注 点 ， 反 映 该 领域 各 个 研究 主题 的 组 成 情况 。 使 
用 CiteSpace 软件 默认 的 EM 聚 类 算法 ( Expectation 
Maximization， 最 大 期 望 算法 ) 对 关键 词 网 络 进行 聚 类 ， 
使 用 LLR 算法 提取 聚 类 标签 ， 设 置 从 Keyword 中 提取 
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聚 类 名 称 。 最 终 获 得 的 聚 类 网 谐 S=0.8966，Q=0.7688 ， 
表明 该 图 谱 网 络 结构 合理 ， 能 够 代表 领域 的 研究 热点 。 
关键 词 聚 类 知识 图 谱 共 有 19 个 聚 类 ， 见 图 6。 其 主要 
涉及 的 研究 领域 包括 : CIO 肝癌 宏观 病因 研究 ， 例 如 
丙肝 病毒 、 非 酒精 性 脂肪 性 肝病 ; (2) 肝癌 微观 病因 
研究 ， 例 如 基因 突变 、 信 和 号 通路 改变 ; (3) 肝癌 的 发 
生机 制 研究 ， 例 如 PI3K/Akt 信号 通路 在 肝癌 发 生发 展 
方面 的 作用 ; CAD 肝癌 免疫 微 环 境 的 研究 ; (5 ) 肝癌 
诊断 和 预后 的 生物 标志 物 以 及 治疗 靶 点 的 研究 。 


2. RNA-seq 应 用 于 肝癌 研究 的 关键 词 时 间 线 图 

时 间 线 图 可 以 展现 领域 研究 发 展 脉络 ， 有 助 于 研究 
者 了 解 重要 关键 词 演进 的 时 间 路 径 。 使 用 CiteSpace 软 
件 在 关键 词 聚 类 的 基础 上 生成 时 间 线 图 ， 得 到 节点 数 为 
178， 连 线 数 为 922 的 时 间 线 图 (图 7) 。 线 条 颜色 代 
表 聚 类 出 现 的 时 间 ， 线 条 上 的 节点 表示 该 聚 类 中 的 关键 
词 ， 节 点 出 现时 间 表 示 该 关键 词 首次 出 现 的 时 间 ， 节 点 
越 大 ， 则 出 现 频次 越 高 。 总 体 来 看 ， 各 模块 关键 词 首次 
出 现 最 为 密集 的 时 期 是 2015-2022 年 ， 这 也 正 是 发 文 量 
快速 增长 的 时 期 。 


6 2001-2022 年 RNA-seq 应 用 于 肝癌 研究 关键 词 聚 类 网 络 图 谱 
Figure 6 Keyword clustering network map of RNA-seq applied to liver 
cancer research from 2001 to 2022 
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7 2001-2022 年 RNA-seq 应 用 于 肝癌 研究 关键 词 时 间 线 图 
Figure 7 Keyword timeline of RNA-seq applied to liver cancer research 
from 2001 to 2022 
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3 讨论 


与 某 一 主题 相关 的 文献 数量 可 以 反映 研究 者 对 该 领 
域 的 关注 度 ， 文 献 数量 越 多 ， 表 明 相 关 研 究 越 活 跃 。 从 
本 研究 发 文 数量 的 年 度 趋 势 可 以 看 出 ，2001 一 2022 年 
期 间 对 于 肝癌 RNA-sed 的 研究 呈 上 升 趋势 ， 并 且 年 累 
计 发 文 增长 曲线 旺 “S” 形 ， 目 前 正人 处 于 前 半 程 发 展 阶 
段 ， 在 2001 一 2016 年 平稳 增长 ， 而 在 2017 年 一 2022 
年 期 间 快 速 增长 。 根 据 普 莱 斯 逻辑 增长 曲线 规律 和 托 马 
斯 库 恩 的 科学 发 展 模式 理论 ,可 知 该 领域 正 处 于 “ 范 
式 积 累 ” 阶 段 ， 即 从 理论 研究 向 应 用 阶段 过 渡 ， 可 以 推 
测 接 下 来 该 领域 的 研究 更 多 会 集中 于 应 用 部 分 ， 即 运用 
RNA-seq 技术 的 研究 成 果 对 肝癌 患者 进行 临床 治疗 。 

对 国家 /地 区 、 机 构 、 作 者 分 布 分 析 可 以 促进 了 解 
该 领域 的 团队 合作 以 及 全 球 合作 情况 ， 协 助 研究 人 员 和 
团队 找到 可 利用 资源 提高 全 球 的 合作 效率 。 从 发 文 作者 
来 看 ， 网 络 图 谱 共 现 密度 不 高 ， 人 研究 者 之 间 较 为 分 散 ， 
因此 该 领域 的 各 人 研究 者 应 该 加 强 相 互 合 作 。 从 发 文 国家 
来 看 ， 综 合 分 析 发 文 量 和 中 心性 两 个 指标 ， 可 知 中 国 发 
文 量 多 ， 占 比 达 54.94%， 但 中 心性 仅 有 0.1， 这 可 能 是 
因为 中 国 研究 者 数量 较 大 ， 但 研究 深度 不 够 ; 美国 发 文 
量 排名 第 二 ， 但 中 心性 排名 第 一 ， 高 达 0.44， 这 说 明 在 
RNA 测序 技术 应 用 于 肝癌 的 这 一 领域 ,美国 科研 实力 
较 强 。 男 外 ， 发 文 数量 最 多 的 10 个 国家 主要 位 于 欧洲 
(5 个 )、 亚 洲 (4 个 ) 和 北美 洲 (1 个 )， 其 中 发 达 
国家 占 比 90%; 具有 影响 力 ( 中 心性 高 于 0.1) 的 国家 
主要 分 布 在 北美 洲 (美国 ) 和 欧洲 ( 德国、 英国 、 巴 西 
和 意大利 ) ， 这 一 情况 也 与 机 构 的 分 布 相 适 应 。 可 知 在 
东西 方 均 有 一 定数 量 的 学 者 对 肝癌 RNA 测序 开展 研究 ， 
但 相 比 之 下 ， 西 方 学 者 更 加 注重 相互 合作 ， 且 研究 更 为 
深入 ， 可 能 是 因为 更 好 的 社会 经 济 发 展 可 以 成 为 确保 足 
够 资金 、 资 源 和 人 力 投 入 的 前 提 ， 以 探索 全 新 的 科学 研 
究 "?" ， 因 此 欧美 地 区 生物 医学 科研 的 起 步 较 早 ， 科 研 
基础 深厚 ,而 中 国 在 癌症 生物 学 研究 这 一 领域 起 步 较 晚 ， 
故 影响 力 略 有 欠缺 , 但 随 着 国力 的 增强 , 科研 投入 增多 ， 
发 文 量 也 逐渐 增多 。 未 来 中 国 应 该 加 强国 家 、 机 构 、 作 
者 之 间 的 交流 ， 提 高 研究 水 平 ， 进 而 增强 在 本 领域 的 影 
响 力 。 

通过 对 关键 词 的 分 析 并 结合 具体 文献 的 研读 ， 可 以 
洞察 肝癌 研究 和 转录 组 测序 技术 两 个 方面 的 发 展 情况 。 
从 本 研究 对 关键 词 的 分 析 可 以 看 出 ， 近 年 来 ， 在 肝癌 人 研 
SEO), DX RNA-seq 技术 的 应 用 逐渐 广泛 ， 肝 癌 的 
危险 因素 、 疾 病 发 生 及 进展 的 分 子 机 制 "1 、 疾 病 诊 
断 和 预后 标志 物 2 、 治 疗 靶 点 U^ 等 方面 的 探索 都 有 
了 质 的 飞跃 。 在 危险 因素 方面 ， 人 研究 发 现 ， 乙 型 肝炎 是 
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肝癌 发 生 的 危险 因素 之 一 ， 其 致 突变 作用 ， 是 由 于 病 
RE DNA 整合 在 人 体 肝 细胞 中 ， 形 成 租 合 融合 转录 本 ， 
进而 诱导 肝癌 的 发 生 '" 1 。 在 生物 标志 物 方面 ， 各 种 基 
DÀ 15 I circRNA 等 生物 标志 物 的 发 现 使 HCC 患者 
在 新 药 试 验 和 临床 实践 中 得 到 了 更 准确 的 管理 ， 也 给 肝 
癌 靶 向 治疗 的 药物 研究 提供 了 方向 。 肝 癌 转 录 组 测序 分 
析 也 可 用 于 精准 医疗 "i ， 大 样本 基因 组 数据 集 与 功能 
组 学 和 其 他 组 学 数据 集 的 整合 为 肝癌 的 治疗 提供 了 新 的 
视角 。 另 一 方面 ， 在 肝癌 领域 方面 的 应 用 也 促进 了 转录 
组 测序 技术 的 发 展 。 首 先 ， 在 技术 改进 方面 ， 相 比 于 原 
来 的 Bulk 测序 ， 单 细胞 测序 技术 的 兴起 为 科研 人 员 的 
精准 研究 提供 了 坚实 的 基础 “ 。 其 次 ， 在 分 析 方法 方 
面 ， 不 断 更 新 的 算法 让 研究 结果 持续 优化 ”  。 另 外 ， 
对 于 转录 组 测序 数据 ， 最 初 只 是 用 生物 信息 学 方法 对 数 
据 进行 分 析 ， 称 为 “ 干 实验 ”; 后 来 结合 免疫 组 化 实验 、 
QT-PCR 实验 等 对 分 析 结 果 进 行 验证 ; 再 到 最 近 使 用 测 
序数 据 来 验证 实验 猜想 ， 再 运用 验证 实验 检验 数据 分 析 
结果 '” i， 研究 思路 的 变化 也 使 得 RNA-seq 方法 的 应 用 
发 挥 了 不 同 价值 。 可 以 预测 ,今后 该 领域 的 研究 将 会 侧 
重 于 将 测序 数据 和 实验 结合 起 来 进行 研究 ， 在 临床 上 则 
是 通过 RNA-sed 实现 肝癌 的 精准 治疗 。 

随 着 大 数据 分 析 时 代 的 到 来 ， 各 领域 的 文献 信息 
激增 ， 通 过 文献 计量 分 析 ， 研 究 人 员 可 以 直观 了 解 领 
域内 研究 的 热点 趋势 ， 明 确 研 究 方向 78 。 本 研究 基于 
CiteSpace 文献 可 视 化 软件 对 WOS 数据 库 中 2001-2022 
年 与 肝癌 RNA-seq 研究 相关 文献 进行 分 析 ， 发 现 国内 
外 该 领域 的 发 文 量 呈 指数 增长 ， 肝 瘤 发 生发 展 的 分 子 机 
制 、 疾 病 的 的 生物 标志 物 和 治疗 靶 点 是 该 领域 的 研究 热 
点 , 但 我 国 各 机 构 的 研究 较为 分 散 , 研究 深度 略 有 人 欠缺， 
未 来 应 该 加 强 同 世界 各 国之 间 的 合作 , 以 提高 研究 深度 。 
本 次 研究 的 局 限 性 在 于 仅 纳入 WOS 数据 库 中 的 英文 文 
献 ， 并 未 纳入 其 他 语言 和 数据 库 中 的 优质 文献 ， 这 会 给 
研究 结果 造成 一 定 偏差 。 未 来 研究 中 ， 应 该 考虑 纳入 知 
网 、 万 方 、PubMed 等 数据 库 中 的 相关 文献 ， 以 便 获 得 
更 加 全 面 的 结果 。 
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